1. Identificação | |
Tipo de Referência | Tese ou Dissertação (Thesis) |
Site | mtc-m21c.sid.inpe.br |
Código do Detentor | isadg {BR SPINPE} ibi 8JMKD3MGPCW/3DT298S |
Identificador | 8JMKD3MGP3W34R/3TR9CEL |
Repositório | sid.inpe.br/mtc-m21c/2019/08.14.01.42 |
Última Atualização | 2019:11.08.11.25.29 (UTC) simone |
Repositório de Metadados | sid.inpe.br/mtc-m21c/2019/08.14.01.42.26 |
Última Atualização dos Metadados | 2019:11.11.21.53.17 (UTC) administrator |
Chave Secundária | INPE-18240-TDI/2921 |
Chave de Citação | Porto:2019:AlAgFl |
Título | Rede protótipo: um algoritmo para agrupamento de fluxo de dados baseado em redes complexas |
Título Alternativo | Prototype network: an algorithm for data stream clustering based on complex networks |
Curso | CAP-COMP-SESPG-INPE-MCTIC-GOV-BR |
Ano | 2019 |
Data | 2019-08-21 |
Data de Acesso | 05 maio 2024 |
Tipo da Tese | Tese (Doutorado em Computação Aplicada) |
Tipo Secundário | TDI |
Número de Páginas | 133 |
Número de Arquivos | 1 |
Tamanho | 6072 KiB |
|
2. Contextualização | |
Autor | Porto, Sandy Moreira |
Banca | Vijaykumar, Nandamudi Lankalapalli (presidente) Quiles, Marcos Gonçalves (orientador) Macau, Elbert Einstein Nehrer Lorena, Ana Carolina Basgalupp, Márcio Porto |
Endereço de e-Mail | sandyporto@gmail.com |
Universidade | Instituto Nacional de Pesquisas Espaciais (INPE) |
Cidade | São José dos Campos |
Histórico (UTC) | 2019-08-14 01:43:57 :: sandyporto@gmail.com -> pubtc@inpe.br :: 2019-08-14 16:40:57 :: pubtc@inpe.br -> sandyporto@gmail.com :: 2019-09-22 17:39:03 :: sandyporto@gmail.com -> pubtc@inpe.br :: 2019-09-24 15:29:54 :: pubtc@inpe.br -> sandyporto@gmail.com :: 2019-10-08 21:44:46 :: sandyporto@gmail.com -> pubtc@inpe.br :: 2019-10-31 16:16:29 :: pubtc@inpe.br -> administrator :: 2019-11-06 11:32:52 :: administrator -> simone :: 2019-11-11 10:17:36 :: simone :: -> 2019 2019-11-11 12:30:54 :: simone -> administrator :: 2019 2019-11-11 21:53:17 :: administrator -> :: 2019 |
|
3. Conteúdo e estrutura | |
É a matriz ou uma cópia? | é a matriz |
Estágio do Conteúdo | concluido |
Transferível | 1 |
Palavras-Chave | Fluxo de dados redes complexas agrupamento MODIS observação da Terra data streams complex network clustering Earth observing |
Resumo | Fluxo de dados são um novo conceito surgido a partir do grande avanço tecnológico das últimas décadas. Data streams, como são chamados em inglês, são sequências de objetos que são gerados em tempo real e, portanto, trazem desafios únicos aos algoritmos que pretendem processá-los. Este trabalho está concentrado na tarefa de analisar os objetos que chegam com intuito de agrupá-los em conjuntos similares. Como os fluxos tendem ao infinito e, geralmente, os dados chegam com rapidez, os algoritmos de agrupamento para este tipo de dado, diferentemente das técnicas tradicionais, tem que desempenhar seus papéis com restrições quanto ao espaço de armazenamento e tempo de processamento que limitam sua atuação. Além disso, o algoritmo a tratar esses dados deve estar preparado para lidar com mudanças e evoluções no conceito dos dados ao longo do tempo. A metodologia apresentada neste trabalho, nomeada Rede Protótipo, utiliza uma estrutura de dados baseada em Redes Complexas para armazenar um sumário inteligente dos dados do fluxo, inteligente porque ao mesmo tempo que agrupa os dados em conjuntos similares, consegue acompanhar os movimentos de conceito sem maiores interferências do usuário. A proposta deste trabalho tem como maior vantagem a dependência de apenas dois parâmetros, MAXV e H, sendo que o primeiro define a quantidade máxima de vértices da rede e o segundo a quantidade de dados recentes do fluxo a serem considerados. Os experimentos relatados nesta tese avaliam o desempenho da Rede Protótipo contra algoritmos clássicos na tarefa de agrupamento de fluxos como CluStream e DenStream, mas também contra outros algoritmos também baseados em Redes Complexas. Os algoritmos são testados com dados sintéticos que simulam mudanças e evoluções de conceito, além de dados provenientes de imagens de Observação da Terra, que se mostraram ainda mais desafiadores para os algoritmos de agrupamento de fluxo de dados. ABSTRACT: Data streams are a new concept that emerged from the significant technological advances of the last decades. Those data are sequences of objects that are generated in real-time and therefore pose unique challenges to the algorithms that intend to process them. This work is focused on the task of analyzing the objects that arrive with the intent of group them into similar sets. Since data streams tend to infinity and data usually arrive quickly, clustering algorithms for this type of data, unlike traditional techniques, have to play their role with storage space and processing time constraints that limit their performance. In addition, the algorithm handling this data must be prepared to deal with changes and developments in the concept of data over time. The methodology presented in this thesis, called Prototype Network, uses a data structure based on Complex Networks to store an intelligent data stream summary, intelligent because while grouping the data into similar sets, it can follow the concept movements without major user interference. The purpose of this work has the most significant advantage of relying on only two parameters, MAXV and H, the first one defining the maximum amount of network vertices and the second the amount of recent stream data to be considered. The experiments reported in this thesis evaluate the performance of the Prototype Network against classical algorithms in the clustering task such as CluStream and DenStream, but also against other algorithms also based on Complex Networks. The algorithms are tested with synthetic data that simulate concept changes and evolution, as well as data from Earth Observation images, which have proven to be even more challenging for data streams clustering algorithms. |
Área | COMP |
Arranjo | urlib.net > BDMCI > Fonds > Produção pgr ATUAIS > CAP > Rede protótipo: um... |
Conteúdo da Pasta doc | acessar |
Conteúdo da Pasta source | originais/@4primeirasPaginas (1).pdf | 29/10/2019 08:11 | 177.0 KiB | originais/Avaliação final pag 01 e 02 de Sandy Moreira Porto.pdf | 29/10/2019 08:29 | 512.8 KiB | originais/TeseSandy_VersaoFinal.pdf | 09/10/2019 08:05 | 5.3 MiB | |
Conteúdo da Pasta agreement | |
|
4. Condições de acesso e uso | |
URL dos dados | http://urlib.net/ibi/8JMKD3MGP3W34R/3TR9CEL |
URL dos dados zipados | http://urlib.net/zip/8JMKD3MGP3W34R/3TR9CEL |
Idioma | pt |
Arquivo Alvo | publicacao.pdf |
Grupo de Usuários | gabinete@inpe.br pubtc@inpe.br sandyporto@gmail.com |
Visibilidade | shown |
Licença de Direitos Autorais | urlib.net/www/2012/11.12.15.10 |
Detentor dos Direitos | originalauthor yes |
Permissão de Leitura | allow from all |
Permissão de Atualização | não transferida |
|
5. Fontes relacionadas | |
Repositório Espelho | urlib.net/www/2017/11.22.19.04.03 |
Unidades Imediatamente Superiores | 8JMKD3MGPCW/3F2PHGS |
Acervo Hospedeiro | urlib.net/www/2017/11.22.19.04 |
|
6. Notas | |
Campos Vazios | academicdepartment affiliation archivingpolicy archivist callnumber contenttype copyholder creatorhistory descriptionlevel dissemination doi electronicmailaddress format group isbn issn label lineage mark nextedition notes number orcid parameterlist parentrepositories previousedition previouslowerunit progress readergroup resumeid schedulinginformation secondarydate secondarymark session shorttitle sponsor subject tertiarymark tertiarytype url versiontype |
|